如何让AI招聘更靠谱?| 数智前沿
据领英(LinkedIn)等招聘网站的调研估计,全球约有35%~45%的企业已经在员工招聘的流程中采用自动化或AI工具。AI工具进行招聘活动具有哪些优点和局限性?如何减少AI工具应用的偏差,降低人们在招聘中对其的不信任感?在新作《数智时代的人力资源管理》一书中,中欧国际工商学院管理学教授韩践对这些问题展开了探讨和解答。
当前,业务主管对于人力资源管理职能最常见的批评就是“招聘和甄选的产出跟不上业务的需求”。这个批评覆盖了“数量”和“质量”两个问题。其中招聘质量比数量问题更具挑战性,因为涉及到“匹配”。
自从科学管理时代以来,人-岗匹配和人-组织的匹配问题一直是企业管理面临的核心挑战之一。导致这个问题的原因有很多:比如,很多企业在招聘时采用一些相对粗糙的人才标准,甚至不使用事先规划的人才标准,“看着顺眼”就进;或者在甄选时过于强调可量化的“硬”技能,而忽视了岗位实际需要的“软”素质。负责招聘的管理者为了节约时间和成本,倾向于使用直觉主导的、信度和效度较低的方法(比如非结构化面试)。
此外,很多公司内部的招聘政策、导向和流程都出现不一致,随意性很强。这些问题都会影响招聘和甄选的效果,降低人员选拔对企业应有的价值。
随着数智技术的发展,我们都期待新技术能够帮助我们提升人才匹配的效率,即用人工智能技术将招聘和甄选过程中重复耗时的工作自动化,并在整个招聘过程中实现个性化的数据分析和推荐功能,使招聘人员可以专注于复杂的甄选判断和沟通工作。
据LinkedIn等招聘网站的调研估计,全球约有35%-45%的企业已经在员工招聘的流程中采用自动化或人工智能工具。下图是数智技术在招聘活动中的常见应用。
01
数智技术在招聘活动中有哪些优势?
数智技术在提升招聘和选拔效率方面有很多优势,比如它可以快速处理大量简历,通过自动化的初步筛选,大大降低初筛阶段的人力和时间成本。现在市场上的一些工具通过自然语言处理(NLP)分析简历和社交媒体数据,评估视频面试的表现,甚至利用算法判断个人与职位的匹配度。
此外,越来越多的算法还能结合各种心理测量量表,比如认知能力和责任心等,根据不同的岗位需求进行加权处理来预测员工的绩效表现。在面试环节,数智应用可以记录和分析候选人的声音(例如音调、音量和节奏)、身体动作(例如手势、姿势等)以及面部表情(如快乐、惊讶、愤怒等),从而综合评估候选人的个人特点、表达风格、沟通技巧、说服力、抗压性,以及逻辑能力,并结合其它测评数据预测申请者的工作表现。
随着算法分析的预测因子增多,以及数据量的增加,算法能更加深入地理解这些因子和工作表现之间的关系,减少预测误差,帮助管理者们更有效地进行人才选拔。
很多企业的招聘所面临的主要问题是缺乏结构化的人员招聘和选拔流程,在这些企业,面试官和决策者的主观喜好起到了比较重要的作用,很可能导致有偏见的决策,从而降低整个招聘体系的内部一致性和甄选效能。在这种场景下,使用数智化工具促进人员选拔流程的标准化和结构化,可以增加申请者们对于申请流程的公平感。
数智技术还有一个重要优势,就是其个性化和适配能力。通过分析简历和招聘需求,算法能够根据市场变化和企业需求,给管理者提供适配建议。相较于传统的信息处理方式,当前数智技术的发展趋势是处理多种数据形式,比如文本、音频和视频,为拉通和整合大量无结构、嘈杂的数据提供了新的可能性。
随着数据管理能力的提升,算法甚至可能打破公司传统的人才选拔框架,发现一些以前未被重视但非常有价值的标准。
近年的一些研究揭示了算法可能会在甄选时带来惊喜:即从数据中挖掘出“非传统”人才:这些人可能来自非“精英”的学院,不一定满足企业常用的一些“硬杠杠”,比如相关工作经验、专业资质或大学成绩,但因其在某些方面表现出的强项(例如责任心强或表达能力出众)而被算法选中。算法这些不走寻常路的“思考”方式可以启发我们拓展人才招聘的思路,提升人岗匹配的效果。目前对于人工智能甄选的有效性已经积累了一定的实证结果。例如,在视频甄选方面的研究表明,经过专家评估的模型通过分析申请者的面部表情、语言和声调信息(如音高),能够较好地预测申请者的性格特质。其中,口头表述的内容文本(即申请者“说了什么”)对预测效果的贡献最大;而面部和声音节律信息对预测效果的贡献则相对较少。进一步看,在训练人工智能评估人格特质,例如“责任心”和“外向性格”时,使用面试官的评价数据比使用申请者自我报告的评估数据效果更好。
此外,人工智能在分析社交媒体数据(如申请者如何在社交媒体中展示自己)方面初现成果。例如,通过分析Facebook(美国社交媒体平台,现称Meta)上的文本内容,人工智能模型可以预测申请者的人格特质和智力水平等,且其预测结果在六个月的时间间隔内保持相对稳定。研究显示,相比于自我报告的人格测试,人工智能基于社交媒体数据预测的人格特质比人类招聘者的预测准确度略有提高。
还有一些研究表明,由算法选拔的候选人通过面试并入职的可能性比一般选拔流程高出14%,这些员工入职后的生产力会高出0.2-0.4个标准差,且在薪资谈判中提出异议的可能性也要低12%。此外,大部分研究都提到使用算法可以大幅节省选拔成本。
02
数智化应用在招聘和甄选领域有哪些局限性?
消除算法的偏见在很大程度上取决于用来训练模型的数据:如果训练模型的数据承接了过往招聘和甄选模式的偏见,那么即便算法和模型是可靠的,偏见可能依然会在数智化招聘中存在,甚至在系统标准化执行的过程中被放大。
在2014年,亚马逊工程师团队启动了一个旨在自动化招聘流程的项目,包括一个用于筛选简历的算法。然而,公司发现该算法对申请软件工程师职位的女性申请者存在系统性歧视。训练算法的数据主要基于男性工程师的简历,导致算法倾向于选择与现有男性员工简历相似的申请者。具体歧视方式包括对毕业于女子学院的候选人不利,降低包含“女性”词汇的简历评分,以及偏好使用男性倾向动词的简历等。尽管程序员尝试修复这一问题,但最终未能成功,亚马逊在一年后停止使用该软件。
这个事件引起了人们对算法偏见的广泛关注,并警醒人们,当数智技术进一步提升企业招聘和甄选效率的同时,企业需要持续识别和刷新那些真正能够促进企业成功和员工高绩效的驱动因素,并以此为基础训练模型,减少由于数据偏差或人类偏见带来的甄选“噪音”。
在招聘和甄选时使用的人才标准一般是基于岗位描述以及企业内部绩优员工的“特征”来构建的。但是,对于这种做法一直有质疑的声音。
首先,输出绩效分数和绩优员工特征的绩效管理体系,是不是很靠得住呢?当被问及“哪些特征能够解释和区分员工之间的绩效差异”时,恐怕很多企业对其绩效评估和管理体系都不是十分自信:大多数企业的绩效考核体系严重地偏向财务指标和显性的量化结果,这些从数字到数字的体系很容易忽略工作过程和员工日常行为。而现实中的绩优员工,是有血有肉的,其特质和绩效之间的关系复杂而“立体”,需要大量过程数据和行为数据来诠释和提炼他们的特点才能形成有效的模型。
如果我们甄选的时候,只关注一些显而易见的表面特征(例如毕业院校、性别、工作经验),而忽略了影响实际工作绩效的深层要素(如合作精神、学习潜力等),根据这样的模式构建的算法也会错过一些真正有潜力的候选人。这就是为什么在依赖算法做出重要决策之前,我们必须仔细考量和验证我们用来构建算法的数据质量以及假设的完整性与合理性。
03
如何让AI更“靠谱”?
首先,我们要分析选拔体系的整体效率和效益。
自上世纪90年代以来,企业采纳了多种方法量化和分析招聘的效能。针对招聘体系的分析主要包括成本效益分析、时间效率分析、招聘质量分析(如新员工的早期绩效、离职率和员工满意度)、招聘渠道效果、应聘者体验、招聘转化率以及招聘投资回报率(ROI)等。这些方法能够帮助组织更精准地评估员工招聘的成本、速度、质量以及招聘活动对组织的长期影响。
此外,通过对不同招聘渠道的分析,组织可以找到更有效的招聘途径;通过调查新员工的应聘体验、入职后绩效和满意度,可以帮助我们提升招聘活动的质量和公司的雇主品牌。当我们在这些方面的运营数据积累到一定程度时,还可以建立模型来全面提升招聘和甄选的投入和产出。
值得注意的是,使用数智化工具并不是提升甄选效果的灵丹妙药。当前企业的招聘和选拔体系常常被诟病“无效”,关键问题是投入不足,急功近利。很多企业倾向于选择低成本且方便的招聘方法,例如仅仅采用面试就做出决策,省去了笔试、特质评估和工作样本等多种测试结合的方法。这样做虽然降低了局部的成本,但可能导致因人员配置不当影响整个组织的效率和效益。
工业心理学的大量研究表明,管理成熟度更高的企业通常会采用多种甄选方式的组合以提升人才选拔的效果,而精心规划和实施招聘活动还将为企业和员工奠定良好的雇佣关系。因此,我们经常说,管理员工体验的起始点是招聘工作开始的那一刻,而不是进入公司签约的时候。
面对AI的发展,企业都有一个“提效梦”。需要提醒企业的是,实施算法招聘需要在数据获取、清洗、软硬件以及培训方面进行大量的前期投资;包括对算法进行反复培训,提升其模型的有效性和准确度。前期的投入会耗费大量资源,企业对此要有合理的预算和预期。
其次,从提出一些“靠谱”的问题开始。
无论是否使用算法,我们做招聘和甄选都要面对两个关键问题:一、如何不断迭代人员甄选的标准和过程,使之有助于预测申请者未来的工作绩效?二、如何不断提升申请者在招聘和甄选过程中的体验,使之有助于提升企业的吸引力和雇主品牌?
从管理过程看,我们还可以把这两个大问题拆解成一系列的小问题:
- 如果我们在甄选中使用数智化工具,在多大程度上可以有效预测申请人的实际工作表现?
- 数智化工具是否经过历史数据或员工试用期的数据分析等实证研究检测?
- 是否使用了广泛而多样的数据样本训练甄选模型,以确保数智化工具对于不同群体的预测是准确而无偏的?
- 算法的设计能否反映工作的职责和要求?
- 算法选拔的内容是否能够通过企业内外部专家的参与和评估,以确保其选拔的内容与实际的工作密切相关?
- 算法选拔的过程是否透明且能够被用户(如人力资源从业人员、业务主管或应聘者)理解和信任?
回答这些问题,需要不断实践、试验、复盘和迭代,不断重复这些问与答,能够让我们在萃取技术价值、提升招聘和甄选效能方面少走弯路。
此外,还有一个常见的问题是,专业的招聘经理会不会被算法所替代?笔者认为,目前来看,跟有经验的招聘经理相比,算法还无法从认知角度复制人类招聘和评测雇员的“直觉”或“经验感”,当评估诸如“领导力”或“团队合作”等难以量化、具有情境性的软技能时,使用算法的效果并不理想。
面向未来,员工甄选的有效性依然取决于组织目标、职位分析、甄选设计等要素的匹配,而最优的甄选结果通常来自于人类专家与机器的混合:人工智能提升甄选效率和数据驱动的洞察,助力减少人为的偏见;人类专家则通过情境理解力、适应性判断和伦理考量来整体提升甄选的效果。
中欧国际工商学院研究助理郭景豪对此文的写作亦有贡献。
来源 | 经济观察网